Notícias

Robôs do Google aprendem a pesquisar e pensar sozinhos

O Google DeepMind apresentou recentemente dois modelos inovadores de inteligência artificial (IA) que prometem levar os robôs a um novo nível de inteligência. Agora, em vez de apenas seguir comandos, as versões atualizadas do Gemini Robotics 1.5 e seu parceiro Gemini Robotics-ER 1.5 têm a capacidade de pensar, pesquisar e compartilhar habilidades entre diferentes robôs. É uma verdadeira revolução para a robótica!

Segundo o Google, esses novos modelos são um “passo fundamental para navegar nas complexidades do mundo físico de forma inteligente e ágil”. O que isso significa? Basicamente, estamos passando de robôs que apenas reagem a comandos para sistemas que conseguem raciocinar, planejar e usar ferramentas de forma autônoma.

Um dos pontos mais interessante é a capacidade desses robôs de generalizar. Esse termo pode parecer técnico, mas refere-se à habilidade de aplicar conhecimentos em novas situações. Por exemplo, enquanto um robô convencional poderia aprender a dobrar uma calça, ele não conseguiria replicar esse esforço com uma camiseta a menos que todo o processo fosse programado manualmente. Agora, os novos modelos podem fazer associações, ler o ambiente e resolver problemas de forma mais intuitiva.

São capazes de tarefas surreais como separar peças de roupas por cor, fazer uma mala seguindo a previsão do tempo consultada online ou até verificar as regras locais de reciclagem. Para muitas pessoas isso pode parecer simples, mas exige um entendimento que até pouco tempo atrás estava além do alcance das máquinas.

Aliás, os resultados já são promissores: em um experimento, os robôs identificaram objetos e os colocaram no lixo correto de acordo com as diretrizes de reciclagem de São Francisco. Eles usaram câmeras para entender visualmente cada item e tomaram decisões baseadas em contextos. O sucesso desse experimento variou entre 20% e 40%, um número que pode não ser perfeito, mas é muito impressionante para um sistema que está apenas começando a entender essas nuances.

Como o Google transforma robôs em super-robôs

Esses dois modelos têm papéis distintos. O Gemini Robotics-ER 1.5 funciona como o “cérebro”, criando planos e obtendo informações através da Pesquisa do Google. Por outro lado, o Gemini Robotics 1.5 é responsável pela execução física da tarefa com base nessas orientações.

Em termos simples, o Gemini Robotics 1.5 transforma informações visuais e comandos em ações, enquanto o Gemini Robotics-ER 1.5 organiza essas tarefas em um passo a passo. Por exemplo, ao separar roupas, o robô considera que “roupas brancas vão para um lado e as coloridas para outro”, quebrando isso em movimentos mais simples de serem realizados.

O CEO do Google, Sundar Pichai, ressaltou que esses novos modelos ajudam os robôs a raciocinar melhor e utilizarem ferramentas digitais, além de aprenderem com suas experiências. Isso é o que ele chama de “próximo grande passo rumo a robôs de uso geral que realmente sejam úteis”.

Essa inovação coloca o Google em concorrência com empresas como Tesla e Boston Dynamics, cada uma com sua própria visão sobre a robótica. Enquanto a Tesla planeja uma produção em massa de robôs, a Boston Dynamics investe em habilidades atléticas para suas máquinas. O diferencial do Google parece ser a adaptabilidade das suas IA, que permitem aos robôs reagir de forma eficiente em diversas situações.

Esse é um momento crucial, já que empresas de robótica nos Estados Unidos estão pedindo uma estratégia nacional para o setor. No cenário atual, a China está liderando o jogo em robótica, com 1,8 milhão de robôs operando em fábricas e ambientes industriais.

O approach da DeepMind é bem diferente do tradicional. A programação robótica, normalmente, exige que cada movimento seja minuciosamente definido por engenheiros. Agora, esses modelos aprendem com as experiências e se adaptam rapidamente. Por exemplo, se um objeto escorrega, o robô consegue se ajustar e continuar a tarefa sem problemas.

Esses novos modelos são uma evolução em relação ao que vimos antes. Antes, os robôs eram limitados a tarefas isoladas, mas agora conseguem realizar sequências que até muitos humanos teriam dificuldade. Uma tarefa como arrumar uma mala após verificar o clima se torna uma possibilidade real!

Para desenvolvedores que querem explorar essas inovações, o Gemini Robotics-ER 1.5 já está disponível na API Gemini do Google AI Studio. Isso significa que eles podem começar a trabalhar com essa nova abordagem de raciocínio. O modelo de ação, no entanto, ainda é reservado para parceiros selecionados, o que gera certa exclusividade.

A jornada da robótica e da inteligência artificial avança, e a cada passo ficamos mais próximos de um futuro em que os robôs podem realmente ajudar em nosso dia a dia.

Rafael Cockell

Administrador, com pós-graduação em Marketing Digital. Cerca de 4 anos de experiência com redação de conteúdos para web.

Artigos relacionados

Botão Voltar ao topo